- ГОСТ 7.66-92: Система стандартов по информации, библиотечному и издательскому делу. Индексирование документов. Общие требования к координатному индексированию
Терминология ГОСТ 7.66-92: Система стандартов по информации, библиотечному и издательскому делу. Индексирование документов. Общие требования к координатному индексированию оригинал документа:
1. Автоматизированное индексирование - индексирование, технология которого предусматривает использование формальных процедур, осуществляемых с помощью вычислительной техники, и может включать применение интеллектуальных процедур при принятии основных решений о составе поискового образа.
Определения термина из разных документов: Автоматизированное индексирование2. Автоматическое индексирование - составление поискового образа с использованием только формальных процедур обработки текста документа или запроса, осуществляемых средствами вычислительной техники.
Определения термина из разных документов: Автоматическое индексирование7.4. Выявление информативных частей документа
Технология АИ должна предусматривать идентификацию и предоставление индексатору или программе индексирования наиболее информативных фрагментов документа из списка указанных в п. 2.1. Могут быть предусмотрены алгоритмы выявления информативных фрагментов по другим формальным критериям, а также по решению специалиста-индексатора.
Определения термина из разных документов: Выявление информативных частей документа7.5. Идентификация слов текста
7.5.1. Процесс идентификации слов текста должен включать: отождествление словоформ одного слова и определение информативных слов текста.
При этом может быть необходимо использование интеллектуальных процедур для решения таких задач, как выявление и обработка синтаксических конструкций, выявление и разрешение омонимии.
7.5.2. Для идентификации слов текста используют машинные словари (словари основ, парадигм, словосочетаний и т.д.). Словари должны быть представлены в базе данных системы и обеспечены средствами визуализации и ведения.
7.6. Формирование списка ключевых слов текста
7.6.1. В процессе формирования списка ключевых слов текста проводится синтаксический анализ текста с учетом правил сочетаемости грамматических категорий данного естественного языка.
7.6.2. Синтаксический анализ текста решает задачи:
1) разделение текста на фрагменты по заданным критериям;
2) установление синтаксических зависимостей между словоформами текста;
3) отождествление словосочетаний;
4) нормализация выявленных ключевых слов.
7.7. Автоматическое формирование ПОД
7.7.1. В процедуре AИ допускается формирование ПОД из свободных ключевых слов или дескрипторов информационно-поискового тезауруса, используемого в данной области.
7.7.2. При АИ дескрипторами информационно-поискового тезауруса на этапе формирования ПОД происходит замена ключевых слов на дескрипторы, указанные в тезаурусе.
7.7.3. При формировании ПОД из дескрипторов возможно обогащение ПОД за счет пополнения вышестоящими терминами информационно-поискового тезауруса.
7.7.4. Процедура АИ должна предусматривать включение в ПОД типовых грамматических средств (см. разд. 5).
7.7.5. К системам АИ предъявляются следующие требования:
1) модульность построения, т.е. такая внутренняя организация лингвистического и программного обеспечения системы при которой процедуры решения отдельных задач АИ реализуются с помощью самостоятельных блоков или модулей;
2) ориентация на типовые программные и технические средства;
3) соответствие действующей нормативно-методической документации по координатному индексированию.
Определения термина из разных документов: Идентификация слов текста3. Информативное слово - слово или словосочетание в тексте документа или запроса, которое несет в нем существенную смысловую нагрузку.
Определения термина из разных документов: Информативное слово4. Контролируемое индексирование - индексирование, при котором предусмотрена замена информативных слов текста дескрипторами, указанными в определенном информационно-поисковом тезаурусе или другом словаре индексирования.
Определения термина из разных документов: Контролируемое индексирование5. Координатное индексирование - индексирование, цель которого состоит во всестороннем отражении содержания документа или запроса путем включения в поисковый образ всех необходимых для этого терминов индексирования.
Определения термина из разных документов: Координатное индексирование6. Лексическая единица (ЛЕ) ИПЯ - последовательность символов, слово, словосочетание, фрагмент слова или условное обозначение, которая рассматривается в данном ИПЯ как элементарная единица, используемая для представления в поисковых образах документов или запросов определенного понятия, объекта или значения параметра.
Определения термина из разных документов: Лексическая единица (ЛЕ) ИПЯ10. Полнота индексирования - степень отражения в поисковом образе содержания документа и (или) запроса, определяемая как отношение числа специфических терминов и фактографических сведений, включенных в поисковый образ, к числу таковых терминов и сведений, имеющихся в тексте документа или запроса.
Определения термина из разных документов: Полнота индексирования7. Свободное индексирование - индексирование, технология которого не предусматривает замену информативных слов текста в соответствии с рекомендациями специального словаря индексирования.
Определения термина из разных документов: Свободное индексирование8. Специфический термин - информативное слово, в наибольшей степени отряжающее содержание документа, использование которого отличает данный документ от других тематически близких документов.
Определения термина из разных документов: Специфический термин9. Специфичность индексирования - характеристика качества индексирования, определяемая отношением числа специфических терминов и фактографических сведений к числу неспецифических терминов в поисковом образе.
Определения термина из разных документов: Специфичность индексирования11. Фактографическое индексирование - индексирование, предусматривающее отражение в поисковом образе документа конкретных сведений (сообщений), являющихся смыслом данного документа.
Определения термина из разных документов: Фактографическое индексирование
Словарь-справочник терминов нормативно-технической документации. academic.ru. 2015.